Lienzo de postmortem sin culpa
Esta plantilla de Post-Mortem "sin culpas" te ayuda a reunir información sobre los incidentes que ocurrieron en producción.
Esta plantilla de Post-Mortem "sin culpas" te ayuda a recopilar información sobre los incidentes ocurridos en producción. Seguir este proceso significa que los ingenieros cuyas acciones han contribuido a un accidente pueden dar un relato detallado de:
qué acciones tomaron a qué hora,
qué efectos observaron,
expectativas que tenían,
suposiciones que habían hecho,
su comprensión del cronograma de eventos tal como ocurrieron.
y que puedan dar esta cuenta detallada sin miedo a castigos o represalias.
El postmortem Blameless incluye las siguientes secciones
Paso 1: Resumen (prellenar antes de la reunión)
Un resumen de alto nivel de la incidencia, centrándose en lo que se sabe hasta este momento y en el impacto que tuvo para el cliente. Limítalo a una o dos frases.
Paso 2: Cronograma aproximado (prellenar antes de la reunión)
Un cronograma aproximado de la incidencia. Dependiendo de lo rápido que se moviera la incidencia, este cronograma podría abarcar desde unos minutos hasta unas horas o unos días. Si tu enfoque principal es mejorar los tiempos de respuesta del equipo durante emergencias, querrás que esto se mida hasta el segundo.
Al capturar el cronograma, asegúrate de incluir:
Cuándo se reportó la incidencia y por quién/qué proceso
Qué acciones se tomaron
Cuando se estableció la comunicación dentro y fuera del equipo
Ideas de Remediación
Cuando te reúnas para discutir la incidencia, invita a todos los que trabajaron en ella. Esto incluye al equipo de soporte para la producción, así como a los miembros del equipo de atención al cliente que pudieran haber estado involucrados.
Revisa el resumen, revisa la línea de tiempo y añade las partes que falten. Luego, pasa a las ideas de remediación.
Estas preguntas están formuladas para ayudar al equipo a asumir la responsabilidad del problema. Hay algunas incidencias que parecen estar fuera del control del equipo (el centro de datos pierde energía, etc). Pero incluso en eventos como esos, el equipo aún puede mejorar su reacción al desastre.
Paso 3: Detectar – ¿Cómo detectamos este problema o un problema como este antes?
Asume que este problema o un problema muy similar ocurrirá de nuevo. ¿Cómo puede el equipo de soporte detectar este problema más rápido y encontrarlo antes de que lo haga un cliente?
Paso 4: React – ¿Cómo mejoramos nuestra reacción ante incidencias como estas?
Asume que se ha reportado la incidencia. ¿Qué tan rápida fue la reacción? ¿Se perdieron minutos mientras las personas enviaban correos intentando que alguien revisara el problema?
¿Cómo puede el equipo reaccionar más rápidamente o de manera más organizada la próxima vez que ocurra esta incidencia?
Paso 5: Solución Rápida: ¿Cómo detenemos la hemorragia más rápido?
Cuando esto vuelva a ocurrir, ¿hay un solución alternativa lista que podamos proporcionar al cliente para reducir el impacto del problema?
Si esto es algo que empeora con el tiempo (como un ataque DDoS), ¿tenemos una forma rápida de cerrar las compuertas mientras descubrimos la causa raíz?
Paso 6: Prevenir: ¿Cómo prevenimos o reducimos el impacto de incidencias similares en el futuro?
Esta es a menudo la única pregunta que los equipos hacen en un postmortem. Es una pregunta importante y deberías dedicarle mucho tiempo. Sin embargo, si te limitas a preguntar solo cómo prevenir una incidencia, te permite no asumir ninguna responsabilidad por las cosas que están bajo tu control (como la forma en que detectas, reaccionas o solucionas rápidamente una incidencia).
Mientras haces una lluvia de ideas, no te limites solo a soluciones técnicas. Mejor monitoreo, mejores vías de comunicación, mejor capacitación, asegurarse de que las personas en asistencia al cliente conozcan a las personas en asistencia de producción por su nombre, etc.
Paso 7: Otras áreas de riesgo: ¿Qué otras áreas comparten esta misma vulnerabilidad?
Cada incidencia es una pista de dónde tu sistema es débil. Es probable que, por cada incidencia que encuentres, haya docenas acechando en las sombras, aún por descubrir.
Es como si vieras un ratón en tu cocina. No tienes un problema de "ratón", tienes un problema de "ratones".
Es probable que haya otras partes del sistema que compartan los mismos supuestos de diseño o, en algunos casos, el mismo código (aunque nadie copia/pega código).
Dedica unos minutos a hacer una lluvia de ideas sobre otros lugares que sean vulnerables de manera similar.
Cuando los equipos están estresados y sobrecargados, omitirán este paso. Encuentro que esta es la pregunta más importante que hacer para lograr que el equipo tenga una mentalidad proactiva y reducir la aparición de incidencias en el futuro.
Paso 8: Próximos pasos (Acciones)
Después de haber identificado todas las cosas posibles que puedes hacer para mejorar cómo se detectan, reaccionan, corrigen rápidamente y previenen las incidencias... y haber encontrado las otras áreas de tu aplicación que necesitan atención... pasa a decidir qué acciones tomar.
La forma en que priorizas esto depende de ti. Pero tengo algunos consejos.
Consigue un nombre y una fecha para cada uno que planees ejecutar antes de salir de la reunión
Si alguien en la reunión está entusiasmado con tomar una de las acciones, anímalo a hacerlo, incluso si piensas que podría no ser lo más importante a solucionar.
Nombres y fechas
En general, he encontrado que a los equipos les gusta este ejercicio (siempre que puedas crear un ambiente sin culpas para la reunión). Les gusta analizar el problema y hacer lluvias de ideas para encontrar soluciones. Sin embargo, todos se sienten ocupados y sobrecargados de trabajo. A menos que esta reunión concluya con propietarios y fechas junto a las cosas que deben hacerse, lo más probable es que ninguna de las mejoras ocurra.
Lo que sucederá es que dentro de 3 semanas, cuando el mismo problema ocurra en producción (pero esta vez de manera más grande), alguien dirá: "oh sí, hablamos sobre arreglar eso." No es un gran lugar para estar.
Para combatir eso, simplemente asegúrate de que haya un nombre y una fecha junto a cada acción que el grupo quiera realizar.
Basado en David Frink Blameless Postmortem Canvas.
Comienza ahora mismo con esta plantilla.
Plantilla de marco para mapa de historia de usuario
Ideal para:
Márketing, Desk Research, Mapas
La técnica de mapa de historia de usuario, popularizada por Jeff Patton en 2005, es una forma ágil de gestionar backlogs de producto. No importa si estás trabajando solo o con un equipo de producto, puedes aprovechar el mapa de historia de usuario para planificar lanzamientos de productos. Los mapas de historia de usuario ayudan a los equipos a mantenerse enfocados en el valor comercial y las características del lanzamiento que le importan al cliente. El marco permite que los equipos multifuncionales compartan el conocimiento sobre lo que tienen que hacer para satisfacer las necesidades de los clientes.
Plantilla de tablero SAFe ROAM
Ideal para:
Agile Methodology, Operations, Agile Workflows
Un tablero de SAFe ROAM es un marco para hacer visibles los riesgos. Te da a ti y a tu equipo un espacio compartido para notar y resaltar los riesgos, para que no sean ignorados. Un tablero de ROAM ayuda a todos a considerar la probabilidad y el impacto de los riesgos y a decidir qué riesgos son de baja prioridad frente a los de alta prioridad. Los principios subyacentes de SAFe (Scaled Agile Framework) son: impulsar soluciones rentables, aplicar el pensamiento sistémico, asumir que las cosas cambiarán, construir de manera incremental, basar los hitos en la evaluación de los sistemas de trabajo y visualizar y limitar los trabajos en progreso.
Plantilla de roadmap de transición Agile
Ideal para:
Metodología Agile, Hojas de ruta, Workflows Agile
Una hoja de ruta de transformación Agile puede ayudarte a ti, a tu equipo y a tu organización con la transición de métodos de cumplimiento rígidos al enfoque más flexible de Agile. Desde requerimientos hasta integraciones de seguridad, puedes crear un mapa de las partes móviles de tu organización al estilo diagrama de carril de natación que puedes actualizar regularmente. Usa la hoja de ruta como una forma de contar la historia de crecimiento de tu producto durante un periodo de tiempo. Consigue aceptación sin manipular y mantén tu hoja de ruta simple, viable y medible. Al usar la hoja de ruta de transformación Agile, puedes evitar enredarte en detalles e invertir ese tiempo en pensamiento estratégico con más perspectiva.
Plantilla de lean canvas
Ideal para:
Metodología Agile, Planificación estratégica, Workflows Agile
Las oportunidades de negocios pueden ponerse densas, engorrosas y complejas, y evaluarlas puede convertirse en un verdadero desafío. El lean canvas optimiza las cosas y desglosa tu idea de negocio para ti y tu equipo. Este modelo de negocio en una página es una gran herramienta para emprendedores y negocios emergentes. Te ofrece una visión global accesible de tu idea para que puedas concentrarte en la estrategia general, identificar amenazas y oportunidades potenciales y hacer lluvia de ideas con los diferentes factores que intervienen para determinar tu rentabilidad potencial en un sector.
Tormenta de ideas para eventos
Ideal para:
Agile
El Event Storming es una técnica de taller colaborativo para explorar problemas empresariales complejos y modelar soluciones. Fomenta la comunicación, descubre dependencias y alinea a las partes interesadas al visualizar el flujo de eventos en un sistema. Esta plantilla empodera a los equipos para mapear procesos, identificar cuellos de botella e iterar hacia soluciones más eficientes, promoviendo la mejora continua y la innovación.
Retrospectiva de las 5Gs
Ideal para:
Metodología Agile, Retrospectivas, Reuniones
La plantilla 5Gs Retrospectiva ofrece un enfoque estructurado para que los equipos reflexionen sobre sus proyectos o iteraciones, centrándose en cinco aspectos clave: Objetivos, beneficios, gratitud, brechas y crecimiento. Proporciona elementos para identificar logros, expresar gratitud y abordar áreas de mejora. Esta plantilla habilita a los equipos a realizar retrospectivas de manera sistemática, fomentando una cultura de aprendizaje, apreciación y mejora continua. Al enfatizar las cinco dimensiones de la reflexión, la retrospectiva 5Gs capacita a los equipos para optimizar su rendimiento, mejorar la colaboración y alcanzar sus metas de manera efectiva.